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摘要 : 采用 长 距 PCR TRKE ASEM EAER T m (Teleogryllus emma) 线粒体 基因 组 全 
序列 。 结 果 表 明 ， 黄 脸 油 萌 芦 的 线粒体 基因 组 全 长 15660bp，A+T 含量 为 73.1%。 谷 氨 酸 、 色 和 氨 酸 及 天 冬 酰胺 的 
转运 RNA 基因 由 IN 链 编码 ， 形成 了 直 翅 目 中 的 第 三 种 基因 排列 顺序 ， 其 余 结构 与 其 它 熏 亚 目 昆虫 的 线粒体 结构 
- 致 。 基 因 间 陋 序 列 共计 73bp, 间隔 长 度 从 1 一 24bp 不 等 ; 有 14 对 基因 间 存 在 共 54bp 登 碱 基数 在 1 一 11 
bp 之 间 。13 个 蛋白 质 编 码 基因 中 12 个 基因 【〈 除 CO I 基因 外 ) 的 起 始 密码 为 标准 的 ATN 组 成 ，COI 基因 的 起 始 
密码 子 为 TTA。 有 10 个 基因 在 基因 3′ 端 能 找到 完全 的 TAA 或 TAG 终止 密码 子 ， 而 有 三 个 基因 〈COI，ND5 
和 ND4) 终止 密码 子 为 不 完整 的 T。 除 RNAS CAGND. 外 ， 其 余 21 个 tRNA 基因 的 二 级 结构 均 属 典型 的 三 叶 草 
结构 。 黄 脸 油 萌 芦 940bp 的 A+T 富 集 区 中 存在 一 个 被 认为 与 复制 起 始 有 关 的 保守 的 二 级 结构 ， 该 结构 不 仅 存在 
于 直 翅 目 昆 虫 中 ， 而 且 也 存在 于 双 翅 目 、 鳞 翅 目 和 膜 翅 目 中 ， 但 是 未 见于 昆虫 纲 的 早期 分 化 类 群 一 一 弹 尾 目 中 。 


关键 词 : 黄 脸 油 葫芦 ， 线 粒 体 基因 组 ;基因 顺序 ， 蠕 贬 科 ， 直 翅 目 
中 图 分 类 号 : Q969.26+34; Q754 ”文献 标识 码 : A — 文章 编号 :  0254-5853-(2008)03-0236-09 
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Complete Mitochondrial Genome of Teleogryllus emma (Orthoptera: 
Gryllidae) with a New Gene Order in Orthoptera 
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(1. College of Life Sciences, Shaanxi Normal University, Xi'an 710062, China; 
2.College of Food Science, Wuhan Polytechnic University, Wuhan 430023, China) 


Abstract: The complete sequence of Teleogryllus emma mitochondrial genome was determined using long PCR and 
conserved primer walking approaches. The results showed that the entire mitochondrial genome of T. emma was 15660 
bp in length, with an A+T content of 74.3%. The most distinct feature of this mtDNA is that the tRNA genes of Glutamic 
acid, Serine and Asparagine are located in the minor strand, and thus constitutes the third type of gene order of 
mitochondria in Orthoptera. The intergenic spacers range from 1 to 24bp in size, totaling 73bp. A total of 54 overlapping 
nucleotides exist among 14 genes, ranging from 1 to 11bp in size. The TAA and TAG codons are used as stop codons in 
all the protein coding genes (PCGs) except COI, ND5 and ND4. The COI gene has an unusual start codon, TTA, instead 
of ATN or NTG. Most of the tRNA genes, except tRNASer (AGN), form typical secondary structures. An A-T rich 
region of T. emma mitochondrial genome with 940bp in length exists as an ubiquitous secondary structure found in the 
Orthoptera and other orders of Insecta, such as Diptera, Lepidoptera, Hymenoptera, but not in Collembola, which is 


considered the basal group of Insecta. 


Key words: Teleogryllus emma; Mitochondrial genome; Gene order; Orthoptera; Gryllidae 


昆虫 的 线粒体 基因 组 为 双 链 闭合 环 状 分 子 ， 长 个 编码 核糖 体 RNA Cribosomal RNAs) 的 基因 
度 约 为 13 一 19kb (Onychiurus orientalis 12984bp; (Wolstenholme, 1992; Boore, 1999); 同时 ， 基 
Trialeurodes vaporariorum, 18414bp), 一 般 包 括 37 因 组 中 具有 一 个 被 认为 是 与 基因 组 的 复制 与 转录 


个 基因 , 其 中 13 个 蛋白 质 编 码 基因 (protein-coding 有 关 的 非 编 码 序 列 ， 即 所 谓 的 A+T 富 集 区 
gene, PCG), 22 个 转运 RNA (RNAs) 基因 和 两 CWolstenholme, 1992). 
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在 兰 椎 动物 中 ，A+T 富 集 区 被 称 为 控制 区 ， 包 
含 线粒体 DNA 轻 链 的 复制 起 点 COLD. Jf ELTE RETI 
起 点 的 两 侧 具 有 一 些 保守 结构 ， 这 些 结构 被 认为 是 
参与 了 线粒体 DNA 轻 链 的 复制 或 转录 ; 而 重 链 的 












































本 实验 选用 紧 蛇 后 足 股 节 肌肉 为 实验 材料 ， 采 
用 常规 酚 一 氯仿 一 异 戊 醇 抽 提 法 提取 DNA. 
13 PCR 扩 增 
从 GenBank 下 载 了 20 余 种 半 变 态 类 昆虫 的 线 


















































复制 起 始 则 开始 于 轻 链 复制 完成 三 分 之 二 的 位 置 
(Tapper & Clayton, 1981; Hixson et al, 1986). i 
虫 线粒体 基因 组 的 A+T 富 集 区 的 研究 相对 较 少 , H. 
主要 集中 于 模式 生物 果 蝇 中 。 果 量 NN 链 的 复制 起 点 
CON) 位 于 A+T 富 集 区 内 , 且 有 20bp 左 右 的 PolyCT) 
结构 〈T-stretch) 作为 识别 ON 的 标志 ， 同 时 在 ON 
的 两 侧翼 具有 一 些 保守 结构 , 被 认为 参与 了 NN 链 的 
复制 或 者 起 调控 作用 (Brehm et al, 2001; Tsujino et 
al, 2002; Saito et al，2005)。 但 由 于 果 晶 的 A+T 
富 集 区 的 结构 与 半 变 态 昆 虫 的 结构 不 完全 一 样 ， 所 
以 对 昆虫 线粒体 基因 组 内 的 A+T 富 集 区 的 结构 与 
功能 还 有 待 进一步 的 研究 。 
vum iH (Teleogryllus emma? 隶属 于 直 翅 
H COrthoptera) IÆ} (Gryllidae )， 是 我 国 常见 
的 一 种 紧 蛇 。 紧 蛇 科 目前 还 没有 一 种 线粒体 基因 组 
全 序列 被 测 出 ,而 在 GenBank 中 ,整个 直 翅 目 也 只 
有 4 种 线粒体 基因 组 全 序列 的 报道 ， 即 非洲 飞 星 
(Locusta migratoria) (Flook et al, 1995) KI% 
Wh CGryllotalpa orientalis) (Kim etal, 2005) 疑 钩 
Ws CRuspolia dubia) (Zhou et al，2007)， 以 及 摩 
J&H CAnabrus simplex) (Fenn et al，2007)。 这 
些 被 测 出 的 线粒体 基因 组 的 基因 排列 次 序 仅 在 二 
个 亚 目 之 间 存 在 转运 RNA 基因 K 和 DD 的 排列 顺序 
差别 。 

本 文 测 定 了 黄 脸 油 戎 疙 线粒体 基因 组 全 序列 
(GenBank accession No EU557269), 在 对 序列 进行 
拼接 、 注 释 和 详细 分 析 的 基础 上 ， 发 现 了 直 却 目的 
第 三 种 线粒体 基因 排列 方式 ， 并 详细 比较 了 昆虫 
A+T 富 集 区 的 序列 组 成 特点 和 能 够 形成 的 保守 的 
二 级 结构 。 和 希望 通过 对 黄 脸 油 戎 芦 线 粒 体 基因 组 的 
测序 与 分 析 ， 为 研究 蜂 蛇 科 以 及 整个 直 怒 类 群 的 系 
统 发 育 关系 提供 新 的 信息 。 
1 材料 与 方法 
1.1 标本 来 源 

黄 脸 油 戎 疡 标本 由 谢 令 德 教授 于 2005 年 8 月 
采 自 河北 省 保定 市 ， 浸 泡 于 100% 乙 醇 中 ， 在 冰箱 
中 于 CIE. 
1.2 DNA 提取 方法 
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粒 体 基因 组 全 序列 并 采用 ClustalX C Thompson; 
1997) 进行 比 对 , 以 寻找 最 保守 的 区 域 , 设计 长 PCR. 
引物 。 同 时 参照 Simon et al (1994) 发 表 的 线粒体 
通用 引物 序列 设计 二 次 PCR 引物 (Rychlik, 2007) 。 
首先 利用 两 对 引物 (LP03 与 LP04，LP05 5 
LP06) 将 线粒体 DNA 扩 增 为 两 条 相互 重 郑 的 片段 
A 和 B。L-PCR 引物 、 反 应 体系 和 条 件 见 Liu et al 
(2006)。 经 凝 胶 纯 化 的 L-PCR 产物 作为 后 续 PCR. 
(Sub-PCRO 的 模板 。Sub-PCR 扩 增 了 相互 重 登 且 
覆盖 整个 线粒体 基因 组 的 28 个 片段 。 所 有 PCR 产 
物 采 用 1.0% 的 琼脂 糖 凝 胶 电泳 检测 及 纯化 , 使 用 安 
徽 优 晶 CU-Gene ) 公司 的 凝 胶 回 收 试剂 盒 进行 DNA 
回收 。 
14 DNA 测序 
对 Sub-PCR 的 纯化 产物 ， 采 用 直接 测序 或 者 克 
隆 测 序 的 方法 来 获得 序列 信息 。 克 隆 载体 为 Takara 
PMD18-T。 测 序 试剂 盒 为 ABI PRISM BigDye 
Terminator v3.1， 直 接 测 序 反 应 的 引物 与 PCR 引物 
相同 。 大 部 分 测序 工作 在 本 实验 室 进行 操作 ， 测 序 
仪 采 用 ABI 公司 3100-Avant 型 遗传 分 析 仪 
(3100-Avant Genetic Analyzer), 个 别 较 长 的 片段 送 
往 北 京 奥 科 生物 技术 公司 进行 测序 。 
L5 ”序列 拼接 
序列 拼接 由 Staden Package (Ver.1.5.) (Bonfield 
etal, 1995) 中 的 Pregap 4 完成 ， 通 过 设置 自动 删 
除了 序列 中 的 载体 序列 。 组 装 后 的 序列 以 * seq 格 
式 输 出 用 于 线粒体 基因 组 序列 的 注释 。 
1.6 ”线粒体 基因 组 序列 的 注释 与 基因 定位 
线粒体 基因 组 注释 参考 非洲 飞 蝗 和 东方 赎 蚌 等 
线粒体 基因 组 全 序列 的 注释 结果 ,用 Staden package 
中 的 Spin 进行 注释 , 同时 参考 ClustalX1.83 和 NCBI 
的 Blast 比 对 来 确定 出 蛋白 质 基因 、tRNA 基因 、 
IrRNA 基因 、srRNA 基因 和 A+T 富 集 区 在 线粒体 
基因 组 中 的 位 置 。 其 中 tRNA 注释 及 二 级 结构 的 预 
测 参考 了 tRNA- scan-SE € verl1.21 ) 
(http://lowelab.ucsc.edu/tRNAscan-SE/) (Lowe & 
Eddy, 1997) 的 搜索 结果 ， 部 分 tRNA 通过 比 对 ， 
手工 画 出 了 它们 的 二 级 结构 。A+T 富 集 区 保守 二 级 
结构 的 预测 ， 使 用 RNAdraw1.10 (Hofacker et al, 
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1995)， 选 择 默认 参数 进行 计算 。 此 外 , 序列 碱 基 组 
成 等 数据 由 MEGA3.0 (Kumar etal, 2004) 完成 。 


2 结果 


2.1 基因 组 成 与 基因 排列 

黄 脸 油 戎 芦 线粒体 基因 组 全 长 15660bp，A+T 
含量 为 73.1%。 这 一 线粒体 基因 组 大 小 在 直 却 目 已 
之 表 的 序列 中 处 于 一 个 中 间 水 平 [ 摩 门 繁 斯 15 766 
bp (Fenn etal, 2007); 疑 钓 额 复 14971bp (Zhou et 
al，2007)]。 整 个 基因 组 包括 13 个 蛋白质 基因 、22 
个 tRNA 基因 、 两 个 核糖 体 RNA 基因 ， 还 有 一 个 
介 于 tRNA 基因 和 125 rRNA 基因 之 间 的 非 编码 区 ， 
BD A+T 富 集 区 (图 1 和 表 1)。 基 因 位 置 与 非洲 飞 







































































































































































Teleogryllus emma 


Mitochondrial DNA 
15 660 bp 














图 1 黄 脸 油 萌 产 线粒体 基因 组 的 结构 


Fig. 1 Gene map of the mitochondrial genome of 




















Teleogryllus emma 
N 链 编码 的 基因 用 加 下 划 线 表示 ,tRNA 基因 用 所 编码 氨基 酸 的 单字 
于 表示 。L1,L2, S1 和 S2 分 别 表示 tRNAL CUP. tRNA "UVP, ig ASI (AG) 
和 tRNA "CP, 


Those genes encoded by the N strand are underlined. The tRNA genes are 




































































designated by single letter amino acid codes. L1, L2, S1 and S2 denote the 
tRNA“ CUP. gp ALOUUR) RNAS ON), ig ASPUCN). respectively. 





蝗 和 其 他 直 却 目 昆虫 不 同 处 是 tRNA“*、 RNAS IAO 
和 tRNA^" 由 NN 链 编码 ， 即 不 是 通常 的 ARNSEF £5 
构 ， 而 是 ARESNF 结构 ， 同 时 ，1RNA”” 与 rRNA^" 
之 间 的 结构 ， 也 与 非洲 飞 凰 DK 结构 相反 ， 而 与 直 
X8 FH S&XV HIT] KD 结构 一 致 (图 2)。 除 A+T ER 
区 外 ,整个 基因 组 的 基因 间隔 区 总 长 77bp, 间隔 长 
EM 1 一 24bp 不 等 ; 有 15 对 基因 间 存 在 共 56bp 
车 ， 重 辣 碱 基数 在 1 一 11bp 之 间 ( 表 1)。 
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黄 脸 油 萌 芦 线粒体 基因 组 与 其 他 昆虫 种 类 一 
样 ， 具 有 很 高 的 碱 基 组 成 偏向 性 ，A+T 含量 为 
73.1%,， 介 于 非洲 飞 蝗 (75.3%) Ej ZR 7j Beli (70.5% ) 
之 间 。 此 外 ,， 蛋 白质 编 码 基因 的 密码 子 第 三 位 A+T 
的 含量 (81.5%) 明显 高 于 第 一 位 及 第 二 位 〈 分 别 
为 68.2% 和 68.196) C 2)， 这 与 密码 子 第 三 位 的 选 
择 压 较 小 有 关 ， 同 时 也 符合 线粒体 基因 组 中 的 
GC—AT 突变 的 进化 趋势 .A+T 富 集 区 的 A+T 含量 
(73.994) WAJEN KHE (86%) 那样 高 ， 而 是 与 整 
个 基因 组 A+T 含量 基本 相当 。 
22 蛋白质 编码 基因 
黄 脸 油 葫芦 线粒体 基因 组 中 13 个 蛋白 质 编码 
基因 中 的 12 个 〈 除 CO 工 基因 外 ) 的 起 始 密码 都 为 
标准 的 ATN 组 成 ( 表 1), 其 中 6 个 为 ATG CCO JI, 
ATP6, COII, ND4, ND4L, Cyt b): 5 个 为 ATT 
C(ND2, ATP8, ND3, ND5, ND6); 1 个 为 ATACND1)。 
而 CO 7 的 起 始 密码 较为 特殊 ， 为 TTA。 
黄 脸 油 萌 芦 线 粒 体 基因 组 中 有 10 个 基因 使 用 
了 完全 终止 密码 (8 个 为 TAA，2 个 为 TAG， 见 表 
1)， 有 3 个 基因 (CO11，ND5 和 ND4) 与 其 下 游 的 
tRNA 基因 重 登 ， 使 用 了 不 完全 终止 密码 子 T. H 
前 普遍 认为 , 不 完全 终止 密码 子 工 可 能 通过 mRNA 
加 工 过 程 中 的 多 聚 腺 背 酸 化 形成 完整 的 终止 密码 
子 TAA (Anderson et al, 1981; Ojala et al，1981; 
Luetal，2002)。 
2.3 tRNA 基因 
3805 n SR P ERES tRNA 的 长 度 范 围 为 61—70 
nt, 全 部 的 22 A tRNA (Leu FI Ser 各 有 两 种 tRNA， 
ERHI 18 种 氨基 酸 各 一 种 RNA) P, KR tRNA ^0 
外 都 能 形成 标准 的 三 叶 草 结构 (图 3), 氨基 酸 接 受 避 
(AAstem) 为 7 个 碱 基 对 , 反 义 密 码 子 臂 (AC stem) 
有 5 个 碱 基 对 。 唯 一 一 个 无 法 形成 三 叶 草 结构 的 
IRNA ^99, Et DHU 臂 上 也 形成 了 典型 的 Type-9 
结构 (Zhou et al，2007)。 同 时 ， 除 rRNA?" 之 外 ， 
其 余 21 种 tRNA 的 反 义 密码 子 环 CAC loop) 都 是 
标准 的 7nt 结构 。DHU 臂 的 长 度 为 3 一 Sbp， 而 工 
BA 3—6bp; 长 度 变 化 较 大 的 是 DHU 环 、T 环 以 
及 可 变 环 CV loop)， 长 度 分 别 为 3—8nt. 3—11nt 
和 3 一 5nt。 

与 细胞 质 中 的 tRNA 相 比 ， 线 粒 体 tRNA 在 各 
个 臂 上 存在 较 多 的 错 配 现 象 。 在 黄 脸 油 萌 芦 的 22 
个 tRNA 中 ,共有 40 对 错 配 ， 其 中 26 个 以 G-U B 
对 方式 存在 ， 部 分 的 碱 基 错 配 可 以 通过 RNA 编辑 
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进行 校正 CYokobori, 1995). tRNA 结构 中 存在 





1991; Watanabe, 1994). 
24 rRNA 基因 
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WEM ARAA rRNA 基因 同 
， 位 于 两 个 保守 的 区 段 之 间 
于 tRNA" O™ 与 IJRNAY Z y] 
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tRNAV 和 A+T 富 集 区 之 间 , 长 度 分 别 是 1293bp 和 
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他 节肢 动物 
> BH 16S rRNA 位 


812bp, AHT 含量 分 别 为 为 75.25% 和 71.6896. 
表 1 黄 脸 油 葫 芦 线粒体 基因 组 成 


Tab.1 Mitochondrial gene profile of Teleogryllus emma 


Feature 


tRNA” 
tRNA?" 
tRNAP 
ND2 
tRNA”? 
tRNA®" 
tRNA™ 
COX J 
tRNA" UYR) 
COX II 
tRNA®" 
tRNA“? 
ATP8 

ATP6 
COX71 
tRNA?P 
ND3 
tRNA” 
tRNA“ 
tRNA”™ 
tRNASe''^GN) 
tRNA^” 
IRNAP'* 
ND5 

" R. N, [AHis 
ND4 

ND4L 
tRNA™ 
tRNA?” 
ND6 

CYTB 
tRNA UN 
NDI 
tRNA" CU 
IrRNA(16s) 
tRNA™! 
srRNA(12s) 
D-Loop(CR) 


a: 基因 起 始 位 置 

















Region" Size 
From Stop (bp) 
1 68 68 
(66 134) 69 
136 204 69 
205 1203 999 
1202 1269 68 
(1262 1322) 61 
(1328 1394) 67 
1390 2931 1542 
2927 2990 64 
2992 3670 679 
3671 3740 70 
3741 3805 65 
3806 3961 156 
3955 4638 684 
4638 5420 783 
5423 5489 67 
5490 5840 351 
5840 5905 66 
5905 5966 62 
(5965 6031) 67 
(6033 6099) 67 
(6100 6164) 65 
(6174 6237) 64 
(6238 7951) 1715 
(7969 8031) 63 
(8035 9376) 1342 
(9370 9666) 297 
9669 9732 64 
(9733 9799) 67 
9810 10319 510 
10319 11455 1137 
11455 11517 63 
(11542 12486) 945 
(12481 12546) 66 
(12547 13839) 1293 
(13840 13908) 69 
(13909 14720) 812 
14721 15660 940 
括号 括 起 来 表示 该 基因 








的 2.5 A+T 富 集 区 
这 些 变异 被 认为 是 与 物种 的 进化 相关 联 的 (Takashi， 
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黄 脸 油 葫芦 的 A+T 富 集 区 全 长 940bp， 结 构 与 


非洲 飞 蝗 的 一 样 ， 也 在 A+T 富 集 区 和 相 邻 的 125 


rRNA 基因 








区 域内 有 两 段 重复 序列 Rpt1(187 bp) 和 
Rpt2(188bp)。 两 段 重复 序列 之 间 只 有 个 别 碱 基 的 差 




















ATT 


TTA 


ATG 


ATT 


ATG 


ATG 


ATT 


ATT 


ATG 


ATG 


ATT 


ATG 


ATA 


Codon 


Start To 


TAA 


TAA 


TAA 
TAA 
TAG 


TAG 


TAA 


TAA 
TAA 


TAA 


而 在 重复 





128 rRNA 位 于 有 57bp IRE. 


H 








Intergenic 


pab 
nucleotides 


N 链 编 码 (Brackets denote that the genes are encoded in 
the N strand); b: IGN: Intergenic nucleotides, 基因 间 的 核酸 序列 , 负 号 表示 基因 间 发 生 





EZ (Numbers 





correspond to the nucleotides separated by different genes. Negative numbers indicate overlapping 


nucleotides between adjacent genes). 

















| Rptl 与 128 rRNA 基因 
区 以 外 的 部 分 ， 存 在 一 
个 长 度 为 6bp 的 5' 端 为 “TA” 的 茎 - 环 结构 ( 图 4A)。 
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直 翅 目 线粒体 基因 排列 次 序 


Ul 1 





























1 戎 芦 线 粒 体 基 因 组 最 主要 的 特征 是 在 昆 





























一 利 


虫 中 通 
al,1995) 发 和 9 








H PTA AAI tRNA 基 














I1 ARNESF(Flook et 
E 了 重 排 ， 形 成 了 ARESNF 排列 。 这 是 





动物 学 研究 29 卷 
Locusta migratoria 
coii [D[K [ATPS ND3 [AJ RJ NJ[S|E| E, NDS 
Gryllotalpa orientalis 
-cok Da ———  ND3[A[RIN[STETEINDS. - 
Ruspolia dubia 
corr |k | p [ATP8 ND3 | A| R| N[|S:| E| EJND$ 
Anabrus simplex 
COII [K [ D [ATPS ND3 |A| R|N[S:| E| EJ NDS 
Teleogryllus emma 
CoN [K [ p [ATP8 ND3 | A |R| EJ S] N| E|NDS 
图 2 5 种 直 翅 目 昆虫 线粒体 基因 组 的 基因 排列 顺序 
Fig.2 Mitochondrial genes arrangements of five species in Orthoptera 
N 链 编码 的 基因 用 下 划 线 标 出 。tRNA 基因 以 编码 的 氨基 酸 缩写 表示 ， 虚 线 表 示 上 共有 相同 排列 而 未 显示 的 基因 。 
All genes are encoded by the J strands except genes indicated by underbars. The tRNA genes are designated by 
single—letter amino acid codes. The broken line denotes the genes which are the same order, but not shown in here. 
表 2 黄 脸 油 葫芦 线粒体 基因 组 碱 基 组 成 情况 
Tab.2 Nucleotide composition within the Teleogryllus emma mitochondrial genome 
T C A G Number AT+T AT-skewe — GC-skew? 
All gene 32.6 17 40.5 9.8 15660 73.1 0.11 -0.27 
rRNA genes 42.3 7.6 31.5 18.5 2105 73.8 -0.15 0.42 
tRNA genes 37.8 9.8 37 15.4 1456 74.8 -0.01 0.22 
D-Loop 322 16.1 41.7 10 940 73,9 0.13 -0.23 
Protein genes 41.5 13.8 312 13.6 11124 72.7 -0.14 -0.01 
All codens 
lst 36.5 13.3 31.7 18.5 3708 68.2 -0.07 0.16 
2st 44.3 17.3 23.8 14.6 3708 68.1 -0.30 -0.08 
3st 43.7 10.7 37.8 7.8 3708 81.5 -0.07 -0.16 
Genes on H-strand* 
Ist 30.8 17.7 33.7 17.9 2265 64.5 0.04 0.01 
2st 41.3 21.1 25.2 12.4 2265 66.5 -0.24 -0.26 
3st 38.1 13.5 44.4 4 2265 82.5 0.08 -0.54 
Total 36.7 17.4 34.4 11.4 6795 yl -0.03 -0.21 
Genes on L-strand" 
Ist 45.5 6.5 28.5 19.5 1426 74 -0.23 0.5 
2st 49 11.4 21.5 18.1 1426 70.5 -0.39 0.23 
3st SAT 6.2 27.4 13.8 1426 80.1 -0.32 0.38 
Total 49.1 8 25.8 ITA 4278 74.9 -0.31 0.36 
a: COI, COII, COII, ATP6, ATP8, Cyt b, ND2, ND3 and ND6; b: ND1, ND4, ND4L and NDS; c: [A-TJ/[A*T]; 
d: [G-CV/[G+C]. 
排列 方式 。 形 成 这 种 排列 方式 的 原因 是 由 于 


N 


tRNA™, ;RNAS"^CP RI tRNA” 这 三 个 基因 所 对 应 
的 DNA 片段 发 生 了 倒置 .关于 DNA 片段 倒置 产生 
的 机 理 , 目前 最 有 说 服 力 的 是 Mark 和 Nick 的 观点 ， 
即 双 链 断裂 和 重新 结合 模型 。 在 mtDNA. 上 两 相 邻 
位 点 可 能 同时 断裂 ， 断 裂 产 生 的 mtDNA 双 链 片段 
























































在 直 翅 目 和 昆虫 岗 以 前 从 未 报道 的 新 的 














基因 





在 相应 酶 的 作用 下 反 向 接 回 断裂 位 点 ， 致 使 基因 倒 
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黄 脸 油 戎 芦 线粒体 22 个 tRNA 的 


Fig.3 Inferred secondary structure of tRNAs of Teleogryllus emma mitochondrial genome 
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Drosophila melanogaster Coreana raphaelis 
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Apis mellifera 





图 4 昆虫 A+T 富 集 区 和 人 类 控制 区 存在 的 保守 二 级 结构 





Fig.4 The conserved secondary structure of A+T rich regions in insects and control region of human 


mitochondrial genome 











A: 6 种 直 却 
和 膜 翅 目 昆虫 A+T 富 集 区 的 


















































昆虫 A+T 富 集 区 的 二 级 结构 (The secondary structure of the A+T rich regions in six species of Orthoptera); B: JH 
-级 结构 ) The secondary structure of the A+T rich regions in Diptera, Lepidoptera and Hymenoptera); C: 人 类 的 
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线粒体 基因 组 轻 链 复制 起 点 COL) 附近 的 二 级 结构 (The secondary structure at Or of human mitochondrial DNA) (Hixson et al, 1986). 


E (Zhong etal, 2005). 

线粒体 基因 顺序 是 研究 生物 较 高 阶 元 系统 发 育 
的 一 种 非常 有 用 的 信息 CBrooe & Brown, 1998), 
从 图 2 不 难看 出 , 从 tRNALys (K) 和 tRNAAsp (D) 
的 排列 顺序 上 文 持 直 翅 目 分 为 两 个 亚 目 ; 蝗 亚 目 

(Caelifera) MWH (Ensifera)。 而 这 样 的 分 类 

系统 也 是 为 学 者 们 广 为 支 持 的 。 与 其 他 狂 亚 目 种 类 
不 同 的 是 黄 脸 油 葫 芦 出 现 的 ARESNF 基因 排列 , 如 
果 这 种 排列 方式 在 所 有 的 蜂 蛇 总 科 都 一 致 的 话 ， 就 
可 以 推断 紧 蛇 总 科 是 得 亚 目 其 他 类 群 的 姐妹 群 ， 甚 
至 也 可 以 像 Ragge 认为 的 那样 ， 蜂 蛇 类 可 以 从 铬 亚 
目 中 划分 出 来 ， 成 为 独立 的 类 群 (Zheng et al, 
1999)。 
32 ”密码 子 变异 分 析 

黄 脸 油 葫芦 线粒体 的 CO /基因 的 起 始 区 以 及 
与 tRNA'" 相 邻 区 域 找 不 到 典型 的 起 始 密码 子 ， 通 
过 与 直 却 目 其 它 种 的 比 对 ， 发 现 与 非洲 飞 凰 CO 7 
的 起 始 密码 CATTA) 处 于 同一 位 置 的 CTTA， 这 是 
一 个 从 未 被 报道 过 的 起 始 密码 ， 所 以 我 们 选择 了 一 
个 不 常见 但 是 很 有 可 能 是 起 始 密码 的 TIA (Lavrov 
etal, 2000; Nardi etal, 20010 作为 黄 脸 油 戎 芦 的 








































































































































































































种 特殊 情况 进行 过 讨论 ， 如 双 翅 目 昆 虫 中 发 现 的 特 
殊 起 始 密码 子 TCG (Junqueiraa et al, 2004) 和 六 
联 起 始 密码 子 (ATTTAA) (Beard etal, 1993), 15 
有 提出 四 联 起 始 密 码 子 的 (ATAA、TTAA 和 ATTA) 
(Wilson et al, 20000. ZEELGEB HL P, Eg Y ZR; Wes 
CO 7 基因 的 起 始 密码 子 为 标准 的 ATG (Kim et al, 
20055 ^l, 非洲 飞 蝗 具有 特殊 四 联 起 始 密码 子 ATTA 
(Flook etal, 1995), Æ J&W (Fenn etal, 2007) 
的 起 始 密码 则 为 CCG, SER (Zhou et al, 2007) 
MEMA, BRA TTA。 但 是 对 于 CO 7 
基因 起 始 密码 子 多 样 性 的 原因 ， 至 今 尚 不 清楚 。 
3.3 A«T 富 集 区 的 重复 序列 、 调 控 序 列 与 保守 的 

二 级 结构 

下 翅 目 昆虫 中 非洲 飞 蝗 A+T 富 集 区 有 重复 两 次 
的 重复 序列 (Flook et al，1995)。 黄 脸 油 戎 上 A+T 
富 集 区 和 与 之 相 邻 的 125 rRNA 基因 组 成 的 区 域内 ， 
也 有 两 段 重 复 序列 Rpt1(187bp) 和 Rpt2(188bp)。 以 
前 曾 有 人 认为 这 些 重复 序列 的 结构 是 保守 的 ， 并且 
与 线粒体 的 复制 过 程 相关 (Zhang et al, 1995, 
1997)。 但 是 从 已 经 公布 的 数据 以 及 我 们 实验 室 一 
些 尚 未 发 表 的 数据 来 看 ， 这 样 的 重复 结构 似乎 与 线 



























































































































































CO 7 的 起 始 密码 子 。CO 7 起 始 密码 子 的 多 样 性 在 





粒 体 基 因 组 的 复制 过 程 关系 不 大 。 因 为 在 同一 目 中 























昆虫 中 相当 普遍 。 以 前 的 多 篇 文献 都 对 CO 7 的 这 








一 些 物种 的 线粒体 DNA 的 A+T 富 集 区 不 含有 这 样 








3 期 叶 “ 伟 等 ， 黄 脸 油 萌 芦 线粒体 基因 组 : 一 种 新 的 基因 排列 方式 243 


的 重复 结构 ， 典 型 的 例子 如 疑 钩 额 繁 CZhou et al; 
2007)。 所 以 这 类 重复 结构 可 能 是 由 复制 滑 移 造 成 
的 ， 而 包含 复制 信息 的 区 域 可 能 是 位 于 重复 区 之 外 
的 部 分 。 

AHT 富 集 区 包含 与 线粒体 基因 组 复制 相关 的 信 
息 ， 这 是 一 个 被 普遍 接受 的 观点 。 目 前 对 该 区 域 的 
关注 也 主要 集中 于 所 包含 的 复制 相关 的 调控 信息 。 
现在 公认 的 是 昆虫 的 线粒体 N 链 的 复制 起 点 (ON) 
位 于 控制 区 内 ,J 链 的 复制 则 是 在 轻 链 的 复制 完成 
97% 之 后 才 开始 ， 即 认为 Oy; (J 链 的 复制 起 点 ) 位 
于 距离 ON 97% mtDNA 长 度 的 位 置 上 (Goddard & 
Wolstenholme, 1978, 1980; Saito et al，2005)。 但 
关于 Oj 的 识别 及 与 之 相关 的 调控 元 件 , 至 今 尚 无 定 
论 。 

Saito et al (2005). 以 果 晶 为 主要 研究 对 象 ， 同 
时 也 对 10 个 目的 20 种 昆虫 的 A+T 富 集 区 进行 了 五 
究 。 根 据 实验 结果 ， 作 者 认为 ON 位 于 控制 区 内 ， 
同时 在 ON 的 上 游 有 一 段 Poly(T) 结 构 ， 可 能 与 复制 
起 点 的 识别 有 关 。 同时 Saito et al (2005) 根据 “97%” 
这 个 原则 , 推断 0j; 也 位 于 控制 区 内 , 并且 在 相应 的 
区 域 也 发 现 了 Poly(T) 结 构 。 由 于 果 蝇 的 控制 区 的 结 
构 与 其 它 类 群 明显 不 同 (Zhang et al，1995)， 所 以 
该 实验 结果 在 其 它 类 群 的 适用 性 还 有 待 进一步 的 
证 明 。Saito et al (2005) 也 认为 像 非洲 飞 蝗 这 样 没 
有 典型 PolyT 结构 的 类 群 ， 可 能 会 有 一 段 序列 来 行 
使 Poly(T) 的 职能 。 
黄 脸 油 萌 芦 的 A+T 富 集 区 找 不 到 典型 的 Poly(T) 
结构 ， 同 时 现 有 的 直 埃 目 昆虫 线粒体 基因 组 中 也 没 

















































































































































































































































































































ms 



























































(Schistocerca gregaria) (Zhang etal, 19955, 草地 
W (Chorthippus parallelus) (Zhang etal, 1995), 
HIET (Oxya chinensis) (Zhang & Huang, 2008) 
EJ CERIS AR RK OST RR PCI, 
使 用 了 不 包括 重复 区 的 序列 ) 进行 了 二 级 结构 的 预 
测 ， 发 现 这 样 的 结构 同样 存在 于 上 述 的 6 个 物种 中 
(图 4A)。 而 同样 的 结构 也 存在 于 全 变态 类 的 韩国 灰 
Zik (Coreana raphaelis) (Kim etal，2006)， 意 
大 利 蜜蜂 (Apis mellifera)CCrozier & Crozier, 1993), 
D) A ERRI CDrosophila melanogaster?) (GenBank 
序列 登陆 号 : NC_001709) 中 (图 4B)， 但 是 在 弹 尾 目 
的 Tetrodontophora bielanensis (Nardi et al，2001) 和 
Gomphiocephalus hodgsoni (GenBank 序列 登陆 号 : 
NC 0054 38) 中 没有 发 现 相 似 的 结构 。 这 些 二 级 结 
构 除 了 在 5′ 端 都 有 “TA”* 结 构 外 ， 在 序列 的 组 成 上 
完全 不 同 。 在 疹 椎 动物 的 线粒体 控制 区 内 ， 也 具有 
类 似 的 与 OL 相连 二 级 结构 ， 被 认为 是 参与 了 轻 链 
的 复制 及 转录 过 程 (图 4C) (Tapper & Clayton, 1981; 
Hixson et al, 1986; Ray & Densmore, 2002, 2003). 
同时 在 昆虫 纲 的 大 部 分 物种 中 , AHT 富 集 区 中 都 含 
有 相当 数量 的 回 文 结构 (palindromes ) MR HER 
序列 Cinverted repeats，IRs )， 这 些 结构 被 认为 是 与 
mtDNA 的 复制 起 始 相 关联 (Arunkumar & Nagaraju， 
2006)。 所 以 我 们 推测 这 样 的 结构 可 能 参与 了 轻 链 
的 复制 过 程 。 而 由 于 昆虫 纲 早 期 分 化 的 类 群 弹 尾 目 
的 两 个 物种 没有 发 现 这 样 的 苓 环 结构 ， 所 以 推测 
样 的 结构 可 能 是 在 昆虫 纲 的 有 地 亚 纲 中 开始 出 现 
的 ， 或 在 昆虫 纲 进化 的 早期 就 存在 而 在 目前 在 弹 尾 
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有 发 现 类 似 的 结构 。 而 由 于 疑 钩 额 繁 的 控制 区 只 有 
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70bp (Zhou et al，2007)， 所 以 据 此 推出， 如 果 轻 
链 的 复制 是 从 控制 区 开始 的 ， 并 且 在 ON 附近 要 有 
一 些 调控 元 件 的 话 ， 那 么 这 70bp 的 区 域内 ， 必 须 
包括 全 部 的 信息 。 通 过 RNAdrawl.10 (Hofacker et 
al, 1995) 预 测 发 现 颖 钧 额 签 的 控制 区 会 形成 一 个 57 
ÜA TA” W 6bp 的 茎 环 结构 。 之 后 通过 对 直 翅 目的 
其 他 6 个 种 一 一 非洲 飞 曙 ， 东 方 赚 时 ， 沙 漠 蝗 
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